Airflow详细搭建过程(亲测 + 总结) |
您所在的位置:网站首页 › airflow web地址 › Airflow详细搭建过程(亲测 + 总结) |
Airflow详细搭建过程(亲测+总结)
官网:Apache airflow Airflow是社区创建的一个平台,用于以编程方式编写,安排和监视工作流。 半个月前搭了一次,现在做一个记录,不逼逼,开始搭建了,全程多图: 环境准备系统: cent os 7 conda版本: 4.8.2 airflow版本 1.10.11 开始搭建我这边会用一个conda创建一个apache airflow的环境: conda create -n airflow_env python=3.7切换到当前的这个环境: conda activate airflow_env 搭建airflow搭建airflow的话,官网有一套详细的文档Airflow 搭建 接下来就按照这个方式来 # airflow needs a home, ~/airflow is the default, # but you can lay foundation somewhere else if you prefer # (optional) export AIRFLOW_HOME=~/airflow # install from pypi using pip pip install apache-airflow # initialize the database airflow initdb # start the web server, default port is 8080 # airflow webserver -p 8080 这里做个修改,后面加上-D参数让它后台运行 airflow webserver -p 8080 -D # start the scheduler airflow scheduler # visit localhost:8080 in the browser and enable the example dag in the home page经过上述的步骤的话,可以在浏览器中打开这个页面: ![]() sqlite不支持多线程,所以我打算切换成mysql,mysql的安装可以参考:Linux centos安装mysql airflow中可选很多其它的选项,那么在airflow里面我们可以选择一些所需的组件,例如现在需要利用mysql存储airflow的相关信息,可选的功能列表在此处airlfow的其它选项 就需要pip install 'apache-airflow[mysql]' 这里,我就不挑了,直接来全套插件,这样就会遇到更多的坑: yum install mysql-devel gcc gcc-devel python-devel krb5-devel.x86_64 cyrus-sasl-devel -y pip install 'apache-airflow[all]' -i https://pypi.tuna.tsinghua.edu.cn/simple/这个时候可能会遇到很多的错误,例如下面的: ![]() ![]() ![]() ![]() ![]() ![]() ![]()
修改下箭头所指的行,修改的内容在注释的下面 使用了mysql作为元数据信息的存储,在mysql里面可以看到: 这个airflow作为一个调度工具,这次只是提到了如何去安装搭建,以后有空的时候,我想补充一篇如何编写airlfow的任务脚本。现在的水平还只是简单的任务脚本的编写,还需要多多努力。 最后,如果大佬看完之后,发现这个文档里面有什么问题,或是有什么更好的建议,请在下方留言。谢谢! |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |